背景和目标。域移位是机器学习模型的泛化问题,当训练集的数据分布与模型部署时遇到的数据分布不同时发生的机器学习模型。由于实验条件,设备和捕获设置的方差,这在生物医学图像分段的背景下是常见的。在这项工作中,通过研究肿瘤球状体分割的神经风格转移算法和未配对的图像到图像转换方法来解决这一挑战。方法。我们已经在Spheroid Semonation的上下文中展示了具有4个深入学习分段模型的域移位问题,该模型在训练分布后的图像测试时实现了超过97%的IOU,但在应用于捕获的图像时,其性能下降到84 \%在不同的条件下。为了解决这个问题,我们已经探索了3种风格传输算法(NST,深图象类比和光刻),以及6个未配对的图像到图像转换算法(Compygan,Dualgan,Forkgan,Ganilla,Cut和FastCut) 。这些算法已集成到高级API中,其促进其应用于发生域移位问题的其他上下文。结果。当应用于在不同条件下捕获的图像通过使用样式传输和图像到图像转换算法时,我们大大提高了4分段模型的性能。特别是,有2个样式传输算法(NST和深图谱)和1个未配对的图像到图像转换算法(Cyclegan),可在0.24至76.07的范围内改善模型的IOO。因此,在训练分布之后应用于使用模型获得的类似的性能。
translated by 谷歌翻译
表格是一种广泛类型的基于模板的文档,用于各种各样的领域,包括,等等,管理,医学,金融或保险。由于日常生成的形式增加,这些文件中包括的信息的自动提取大大要求。然而,由于具有不同形式实体位置的模板的巨大分集以及扫描文档的质量,因此在使用扫描形式时,这不是一项直接的任务,以及扫描文档的质量。在此上下文中,存在一个功能由所有形式共享:它们包含作为键值(或标签值)对构建的互连实体的集合以及其他实体,例如标题或图像。在这项工作中,我们通过基于BERT架构组合图像处理技术和文本分类模型来了解以形式的实体链接问题。这种方法实现了最先进的结果,在Funsd DataSet上的F1分数为0.80,关于最佳方法的提高5%。此项目的代码可在https://github.com/mavillot/funsd-entity-linking中获得。
translated by 谷歌翻译
人工智能(AI),机器学习和深度学习(DL)方法在生物医学图像分析领域变得越来越重要。但是,为了利用此类方法的全部潜力,需要作为训练数据代表数量的实验获得的图像,其中包含大量手动注释对象。在这里,我们将语法(合成数据)介绍为一种新的方法,用于生成合成,光现实和高度复杂的生物医学图像作为DL系统的训练数据。我们在组织学切片中的肌肉纤维和结缔组织分析的背景下显示了方法的多功能性。我们证明,可以在以前看不见的现实世界数据上执行强大和专家级的细分任务,而无需仅使用合成训练数据进行手动注释。作为一种完全参数技术,我们的方法为生成对抗网络(GAN)构成了可解释的可控替代方案,并且有可能在显微镜及其他地区的各种生物医学应用中显着加速定量图像分析。
translated by 谷歌翻译
从语音音频中删除背景噪音一直是大量研究和努力的主题,尤其是由于虚拟沟通和业余声音录制的兴起,近年来。然而,背景噪声并不是唯一可以防止可理解性的不愉快干扰:混响,剪裁,编解码器工件,有问题的均衡,有限的带宽或不一致的响度同样令人不安且无处不在。在这项工作中,我们建议将言语增强的任务视为一项整体努力,并提出了一种普遍的语音增强系统,同时解决了55种不同的扭曲。我们的方法由一种使用基于得分的扩散的生成模型以及一个多分辨率调节网络,该网络通过混合密度网络进行增强。我们表明,这种方法在专家听众执行的主观测试中大大优于艺术状态。我们还表明,尽管没有考虑任何特定的快速采样策略,但它仅通过4-8个扩散步骤就可以实现竞争性的目标得分。我们希望我们的方法论和技术贡献都鼓励研究人员和实践者采用普遍的语音增强方法,可能将其作为一项生成任务。
translated by 谷歌翻译
近年来,空中机器人背景下的高速导航和环境互动已成为几个学术和工业研究研究的兴趣领域。特别是,由于其若干环境中的潜在可用性,因此搜索和拦截(SAI)应用程序造成引人注目的研究区域。尽管如此,SAI任务涉及有关感官权重,板载计算资源,致动设计和感知和控制算法的具有挑战性的发展。在这项工作中,已经提出了一种用于高速对象抓握的全自动空中机器人。作为一个额外的子任务,我们的系统能够自主地刺穿位于靠近表面的杆中的气球。我们的第一款贡献是在致动和感觉水平的致动和感觉水平的空中机器人的设计,包括具有额外传感器的新型夹具设计,使机器人能够高速抓住物体。第二种贡献是一种完整的软件框架,包括感知,状态估计,运动计划,运动控制和任务控制,以便快速且强大地执行自主掌握任务。我们的方法已在一个具有挑战性的国际竞争中验证,并显示出突出的结果,能够在室外环境中以6米/分来自动搜索,遵循和掌握移动物体
translated by 谷歌翻译
上采样器是由问题上采样层引起的,并且由于在上采样时出现的光谱副本。此外,根据所用的上采样层,这种伪像可以是色调的伪像(添加性高频噪声)或过滤伪像(衰减,衰减一些带)。在这项工作中,我们通过研究不同的伪像如何交互和评估模型性能的影响,调查在所产生的音频中具有上采样的伪影的实际意义。为此,我们基准为音乐源分离的大量上采样层:不同的转置和子像素卷积设置,不同的插值上升器(包括基于拉伸和SINC插值的两个新颖的层)和基于不同的基于小波的上升器(包括小说可学习小波层)。我们的研究结果表明,与插值上采样器相关的过滤器件是感知的,即使它们倾向于实现更差的客观分数。
translated by 谷歌翻译
我们展示了一个新的数据集和基准,其目的是在大脑活动和眼球运动的交叉口中推进研究。我们的数据集EEGEYENET包括从三种不同实验范式中收集的356个不同受试者的同时脑电图(EEG)和眼睛跟踪(ET)录像。使用此数据集,我们还提出了一种评估EEG测量的凝视预测的基准。基准由三个任务组成,难度越来越高:左右,角度幅度和绝对位置。我们在该基准测试中运行大量实验,以便根据经典机器学习模型和大型神经网络提供实心基线。我们释放了我们的完整代码和数据,并提供了一种简单且易于使用的界面来评估新方法。
translated by 谷歌翻译
功能连接是研究大脑振荡活动的关键方法,以便为神经元相互作用的潜在动态提供重要见解,并且主要用于脑活动分析。建立脑电脑界面信息几何的进步,我们提出了一种新颖的框架,它结合了功能连接估计和基于协方差的管道来对精神状态进行分类,例如电机图像。针对每个估算器培训的riemannian分类器,并且集合分类器将决策组合在每个特征空间中。提供了对功能连接估计器的全面评估,并在不同的条件和数据集上评估最佳表演管道,称为岩酮。使用Meta分析在数据集中聚合结果,FUCONE比所有最先进的方法更好地执行。性能增益主要是对特征空间的改进的改进的改进,增加了集合分类器相对于和内部主题间变异性的鲁棒性。
translated by 谷歌翻译